Zum Hauptinhalt springen

Dokumente analysieren

Dokumente automatisiert zu verarbeiten bedeutet meist zweierlei: zuerst herausfinden was für ein Dokument vorliegt, und dann was darin steht strukturiert extrahieren. Diese beiden Schritte — Kategorisierung und Extraktion — sind die Grundlage für nahezu jeden dokumentenbasierten Automatisierungsprozess.

Kapitel in diesem Abschnitt

Dokumente kategorisieren — wie du mit einem Switch Agent auf Basis von Dateiendung oder MIME-Type verzweigst, und wie du mit einem Generative AI Agent auch inhaltlich kategorisieren kannst — zum Beispiel ob ein Anhang eine Rechnung, ein Lieferschein oder Spam ist. Inklusive Fallback-Pfad für unbekannte Dokumenttypen.

Daten aus Dokumenten extrahieren und strukturieren — wie du mit dem Read File Agent den Dokumentinhalt einliest und anschließend per Generative AI Agent strukturierte Daten daraus extrahierst. Mit Best Practices für Extraktions-Prompts die in der Praxis zuverlässig funktionieren.